本地blast实操
序列相似性搜索是重要的生物信息学研究之一,常常为新测序基因组或序列片段的功能提供参考,而BLAST是这一系列工具中最流行的相似性搜索工具。1989年,美国国家生物技术信息中心(NCBI)首次推出BLAST。自第一版以来,NCBI一直在维护和更新BLAST版本(ftp://ftp.ncbi.nlm.nih.gov/blast/executables/legacy.NOTSUPPORTED/)。本地BLAST不受网速、序列数目的限制,能够快速、准确的进行序列比对。本期凌波微课为大家带来物种基因组序列进行本地blast的操作方法。具体操作猛戳上方视频哦~
更多精彩内容加入“凌波微课交流群”,满满的干货不容错过,独乐乐不如众乐乐哦~
将BLAST完整的程序执行bin文件夹路径(C:\Users\dell\Desktop\Online\Blast\BLAST\bin)添加到PATH路径之后,在任何地方都可以直接使用程序名运行程序,而不必使用完整的路径名。计算机 →属性 →高级系统设置 →环境变量 → PATH中添加系统变量或用户变量。
formatdb -i .\ref_genome.fasta -p F -o F
-i: 需要格式化的数据库名称-p: 文件类型 :默认为蛋白数据库(T),反之为核酸序列数据库(F)-o: 解析选项:默认解析序列标识并且建立目录(T),反之(F)-n: 重命名数据库文件
2. blastall序列比对参数解读
blastall -p blastn -i .\AE014075.fasta -d ref_genome.fasta -e 1e-5 -m 0 -o blast_out1.txt
-p: 指定要使用何种子程序-d: 数据库,个性数据库或NCBI下载数据库-i: 输入文件,自己整理的序列-o: 输出文件名称-e:指定一个实数,过滤掉期望值大于这个数的比对结果,默认10,e值越大随机匹配的可能性越大,因此设置小的e值增加结果可信度。但在引物特异性检验时,应将e值设大些-F:用来屏蔽简单重复和低复杂度序列( T/F) ,默认T-v:输出中每一个query的比对列表最多显示subject个数,默认500(在-m为8~9的情况下)-b:每个query 最多显示的比对条形图,默认250 (在-m为1~6的情况下)
PS:公众号后台回复“BLAST”,即可获得Blast应用程序和示例文件的下载链接哦~
凌波微课,创意于2020年不平凡的春天,由高通量测序及组学研究领域从业近十年的技术团队精心打造。
凌波微课的讲师们,实战经验丰富,旨在通过在线微课程及线下交流,帮助科研学生及科研工作者们由简入繁,掌握科研思路及生信分析的实际操作。凌波微课,用心服务科研用户,打造专业培训品牌,助力科研提升。
关注凌波微课公众号,回复“入群”,即可加入凌波微课课下交流群,更多干货等你呦!